FILTER MODE ACTIVE

#эффективность данных

Найдено записей: 4

#эффективность данных10.08.2025

От 100 000 до менее 500: как Google с помощью активного обучения сокращает разметку для LLM

'Google демонстрирует, что дообучение LLM возможно с менее чем 500 целевыми метками, сохраняя или улучшая качество модели при сокращении объема разметки на несколько порядков.'

#эффективность данных30.06.2025

DSRL: Управление роботами через обучение с подкреплением в латентном пространстве для реальной адаптации

DSRL представляет инновационный метод адаптации диффузионных политик роботов с помощью обучения с подкреплением в латентном пространстве, значительно улучшая результаты в реальных условиях без изменения базовой модели.

#эффективность данных03.05.2025

Революция в математическом мышлении: как 1-shot reinforcement learning улучшает работу LLM

Исследователи показали, что обучение больших языковых моделей с помощью всего одного примера значительно улучшает их способности решать математические задачи, достигая результатов, сопоставимых с обучением на больших наборах данных.